对话研究的最终目标是开发可以在交互式设置中有效使用的系统。为此,我们在第9对话系统技术挑战中介绍了对话框的交互式评估。该曲目由两个子任务组成。第一个子任务涉及建立知识接地的响应生成模型。第二个子任务旨在通过与真实用户的交互式设置进行评估,旨在将对话模型扩展到静态数据集之外。我们的曲目挑战参与者开发强大的响应生成模型,并探索将它们扩展到与真实用户的来回互动的策略。从静态语料库到交互式评估的发展引入了独特的挑战,并促进了对开放域对话系统的更全面评估。本文概述了曲目,包括方法和结果。此外,它提供了有关如何最佳评估开放域对话框模型的见解
translated by 谷歌翻译
The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.
translated by 谷歌翻译
在本文中,我们提出了一个样本复杂性,以从嘈杂的样本中学习单纯形。给出了$ n $的数据集,其中包括i.i.d.样品从$ \ mathbb {r}^k $中的未知任意单纯形上的均匀分布中得出,其中假定样品被任意幅度的加性高斯噪声损坏。我们提出了一种策略,该策略可以输出一个单纯概率,总变化距离为$ \ epsilon + o \ left(\ mathrm {snr}^{ - 1} \ right)$从true Simplex中,对于任何$ \ Epsilon> 0 $。我们证明,要接近True Simplex,就足以拥有$ n \ ge \ tilde {o} \ left(k^2/\ epsilon^2 \ right)$ samples。在这里,SNR代表信噪比,可以看作是单纯形直径与噪声的标准偏差的比率。我们的证明是基于样品压缩技术的最新进步,这些进步已经显示出在高维高斯混合模型中的密度估计的紧密范围方面的承诺。
translated by 谷歌翻译
社交网络(SN)是一个由代表它们之间相互作用的群体组成的社会结构。 SNS最近被广泛使用,随后已成为产品推广和信息扩散的合适平台。 SN中的人们直接影响彼此的利益和行为。 SNS中最重要的问题之一是,如果选择将它们作为网络扩散场景的种子节点选择,那么他们可以以级联的方式对网络中的其他节点产生最大影响。有影响力的扩散器是人们,如果他们被选为网络中出版问题中的种子,那么该网络将拥有最多了解该扩散实体的人。这是称为影响最大化(IM)问题的文献中的一个众所周知的问题。尽管已证明这是一个NP完整的问题,并且在多项式时间内没有解决方案,但有人认为它具有子模块化功能的属性,因此可以使用贪婪的算法来解决。提出改善这种复杂性的大多数方法都是基于以下假设:整个图都是可见的。但是,此假设不适合许多真实世界图。进行了这项研究,以扩展使用链接预测技术与伪可见性图的电流最大化方法。为此,将一种称为指数随机图模型(ERGM)的图生成方法用于链接预测。使用斯坦福大学SNAP数据集的数据对所提出的方法进行了测试。根据实验测试,所提出的方法在现实世界图上有效。
translated by 谷歌翻译
对网络中的用户如何根据邻居的意见更新他们的意见的理解吸引了网络科学领域的极大兴趣,并且越来越多的文献认识到了这个问题的重要性。在这篇研究论文中,我们提出了有指导网络中意见形成的新动态模型。在此模型中,每个节点的意见被更新为邻居意见的加权平均值,而权重代表社会影响力。我们将一种新的中心度度量定义为基于影响和整合性的社会影响度量。我们使用两个意见形成模型来衡量这种新方法:(i)degroot模型和(ii)我们自己提出的模型。先前发表的研究没有考虑合格,并且仅考虑计算社会影响时节点的影响。在我们的定义中,与高度和较低程度的节点相关的较低度和高度的节点具有较高的中心性。作为这项研究的主要贡献,我们提出了一种算法,用于在社交网络中找到一小部分节点,该节点可能会对其他节点的观点产生重大影响。关于现实世界数据的实验表明,所提出的算法显着优于先前发布的最新方法。
translated by 谷歌翻译
如今,推荐系统和搜索引擎在时尚电子商务中发挥积分作用。尽管如此,许多挑战谎言,这项研究试图解决一些问题。本文首先介绍了一种基于内容的时尚推荐系统,它使用并行神经网络作为输入,通过列出商店中可用的类似物品来获取单个时尚项目商店映像。接下来,增强相同的结构以基于用户偏好来个性化结果。然后,这项工作引入了一个背景增强技术,使系统更强大地对域外查询,使其仅使用培训的目录商店图像进行街道到商店建议。此外,本文的最后贡献是推荐任务的新评估度量,称为客观引导的人为评分。该方法是一个完全可定制的框架,可以产生来自人类评分术的主观评估的可解释,可比的分数。
translated by 谷歌翻译
数据在Web上发布了大量的时间,但大多数数据都是非结构化的,使得很难理解和难以解释。信息提取(IE)方法从非结构化数据获取结构化信息。其中一个具有挑战性的一个任务是事件提取(EE),它寻求从文本中获得有关具体事件及其演员的信息。 EE在许多域中有用,例如构建知识库,信息检索和概述。在过去的几十年中,开发了一些像Ace,Comeo和Icews这样的事件本体,以定义文本中观察到的事件的事件表格,演员和维度。这些事件本体仍然具有一些缺点,例如仅涵盖几个主题,如政治事件,在定义论证角色和金标准数据不足时具有不灵活的结构。为了解决这些问题,我们提出了一个事件本体,即Cofee,它包含专家领域知识和数据驱动方法,用于识别文本的事件。 Cofee由两个层次结构级别(事件类型和事件子类型)组成,包括与环境问题,网络空间和刑事活动有关的新类别,这些类别需要立即监测。此外,根据每个事件子类型的动态角色被定义为捕获事件的各种维度。在随访实验中,在维基百科事件中评估了所提出的本体,并显示为一般和全面。此外,为了便于编写事件提取的金标准数据,基于CoFee提出了一种独立于语言的在线工具。由10人专家注释的金标准数据集也是在波斯语中组成的24K新闻文章。最后,我们提出了一种基于深度学习技术的监督方法,以自动提取相关事件和相应的演员。
translated by 谷歌翻译
自我监督的学习表现出了巨大的希望,因为它可以在没有完全采样的数据的情况下训练深度学习MRI重建方法。当前用于物理学指导的重建网络的自我监督的学习方法分裂获得了两个不相交的数据,其中一种用于独立网络中的数据一致性(DC),另一个用于定义培训损失。在这项研究中,我们提出了一种改进的自我监督学习策略,该策略更有效地使用获得的数据来训练物理学指导的重建网络,而无需数据完全采样的数据。提出的通过数据下采样(SSDU)对所提出的多掩码自我监督的学习(SSDU)应用于获得的测量结果,将其分为每个训练样本的多对不相交集,而使用这些对DC单位和DC单位和其中一对,其他用于定义损失的,从而更有效地使用了不足采样的数据。多面罩SSDU应用于完全采样的3D膝盖上,并前瞻性地采样3D脑MRI数据集,用于各种加速度和图案,并与CG-Sense和单膜ssdu dl-MRI以及受监督的DL-MRI以及当时的DL-MRI进行比较。提供了完全采样的数据。膝盖MRI的结果表明,提出的多面罩SSDU胜过SSDU,并与受监督的DL-MRI紧密相关。一项临床读者的研究进一步将多面罩SSDU在SNR和混叠伪影方面高于监督的DL-MRI。大脑MRI的结果表明,与SSDU相比,多面罩SSDU可以达到更好的重建质量。读者的研究表明,与单罩SSDU相比,r = 8时的多面膜SSDU显着改善了重建,r = 8,以及r = 2时的CG-Sense。
translated by 谷歌翻译
Real-world robotic grasping can be done robustly if a complete 3D Point Cloud Data (PCD) of an object is available. However, in practice, PCDs are often incomplete when objects are viewed from few and sparse viewpoints before the grasping action, leading to the generation of wrong or inaccurate grasp poses. We propose a novel grasping strategy, named 3DSGrasp, that predicts the missing geometry from the partial PCD to produce reliable grasp poses. Our proposed PCD completion network is a Transformer-based encoder-decoder network with an Offset-Attention layer. Our network is inherently invariant to the object pose and point's permutation, which generates PCDs that are geometrically consistent and completed properly. Experiments on a wide range of partial PCD show that 3DSGrasp outperforms the best state-of-the-art method on PCD completion tasks and largely improves the grasping success rate in real-world scenarios. The code and dataset will be made available upon acceptance.
translated by 谷歌翻译
This paper deals with the problem of statistical and system heterogeneity in a cross-silo Federated Learning (FL) framework where there exist a limited number of Consumer Internet of Things (CIoT) devices in a smart building. We propose a novel Graph Signal Processing (GSP)-inspired aggregation rule based on graph filtering dubbed ``G-Fedfilt''. The proposed aggregator enables a structured flow of information based on the graph's topology. This behavior allows capturing the interconnection of CIoT devices and training domain-specific models. The embedded graph filter is equipped with a tunable parameter which enables a continuous trade-off between domain-agnostic and domain-specific FL. In the case of domain-agnostic, it forces G-Fedfilt to act similar to the conventional Federated Averaging (FedAvg) aggregation rule. The proposed G-Fedfilt also enables an intrinsic smooth clustering based on the graph connectivity without explicitly specified which further boosts the personalization of the models in the framework. In addition, the proposed scheme enjoys a communication-efficient time-scheduling to alleviate the system heterogeneity. This is accomplished by adaptively adjusting the amount of training data samples and sparsity of the models' gradients to reduce communication desynchronization and latency. Simulation results show that the proposed G-Fedfilt achieves up to $3.99\% $ better classification accuracy than the conventional FedAvg when concerning model personalization on the statistically heterogeneous local datasets, while it is capable of yielding up to $2.41\%$ higher accuracy than FedAvg in the case of testing the generalization of the models.
translated by 谷歌翻译